科研星球

g:profiler数据库介绍,多ID富集分析

基因组学分析在得到差异表达基因之后,最常做的还是富集分析。通过富集分析我们可以了解相关基因集主要在形式的功能是什么。目前用来做基因富集分析的工具很多。这次介绍的这个叫g:profiler(https://biit.cs.ut.ee/gprofiler/gost);


G:profiler 不止是可以进行富集分析。这个网站包括四个主要的工具:

  1. g:GOSt: 对基因集进行富集分析

  2. g:Convert: 基因ID转换工具

  3. g:Orth: 不同物种之间同源基因名转换

  4. g:SNPense: SNP注释工具


g:GOSt:富集分析

    g:GOSt是一个可以进行富集分析的工具。它可以接受多种多样的输入方式。其中包括:geneid; SNPIDs; 染色体位置;GOterms。另外值得注意的是。它可以接受不同类型的输入。比如输入geneids + 染色体位置 + SNPids。



640 (2).png

    

    富集分析的结果可以通过一个瀑布图和分布热图来进行可视化。同时也提供了数据结果下载的界面。其结果包括11个部分:

  • GO分析结果:BP;CC;MF

  • 通路分析:ReactomeKEGG and WikiPathways

  • DNA相关调控:转录因子调控(TRANSFAC)以及miRNA(mirTarBase)调控

  • 蛋白数据库:CORUM蛋白复合物注释数据库以及人类表型数据库(Human Phenotype Ontology,HPO)

    按照下图显示,即检索结果的默认显示界面,我们可以看到各个注释的结果。结果的横坐标是注释的数据库,总坐标是注释的-log10(P)。每一个点代表一个结果。

1.png

    同时。如果我们点击Detailed Results就可以看到所有详细的结果,同时还可以把结果导出成csv。



640 (1).jpeg


g:Convert:基因ID转换工具

    这个工具和第一个一样也支持多个类型的基因数据。我们需要做的就是设定好想要转换的ID类型即可。


640 (1).png

    导出的结果包括,输入的类型,转换的结果,结果的官方SYMBOL,以及简单的描述。同样的结果可以导出表格格式

640.png



g:Orth:不同物种同源基因转换

    该工具通过收集ENSEMBL数据库里面不同物种基因序列上同源关系的相近程度。寻找不同物种之间相近同源关系的基因。

同样的这个工具也接受多种类型的ID输入。


640 (4).jpeg


    结果当中会显示原始物种和想要转换的物种之间的配对信息


640.jpeg


g:SNPense:SNP注释工


该工具可以用来注释单核苷酸多态的相关信息。其中包括相关的位置信息,所在基因,具体可能的功能。


该文件的输入就是标准的SNP号(rs号)即可


640 (3).jpeg


数据库评价:


    随着基因组学数据的增多,现在出来了有很多基因富集分析的工具。其实就结果而言,主要考虑的还是数据库本身背景数据的更新快慢。如果一个数据库更新很快的话,那结果就会更加准确一些。这个数据库倒是提供了一个多ID兼容的功能。这个有需要的时候可以参考。

    至于其他的。目前基因ID转换工具倒是不多。这个倒是一个备选。



没有账号?